Inciso 3

Column

Estadísticas descriptivas

Data summary
Name select(ecommerce, -c(Emai…
Number of rows 500
Number of columns 5
_______________________
Column type frequency:
numeric 5
________________________
Group variables None

Variable type: numeric

skim_variable n_missing complete_rate mean sd p0 p25 p50 p75 p100 hist
AvgSessionLength 0 1 33.05 0.99 29.53 32.34 33.08 33.71 36.14 ▁▃▇▆▁
TimeonApp 0 1 12.05 0.99 8.51 11.39 11.98 12.75 15.13 ▁▃▇▅▁
TimeonWebsite 0 1 37.06 1.01 33.91 36.35 37.07 37.72 40.01 ▁▃▇▅▁
LengthofMembership 0 1 3.53 1.00 0.27 2.93 3.53 4.13 6.92 ▁▃▇▃▁
YearlyAmountSpent 0 1 499.31 79.31 256.67 445.04 498.89 549.31 765.52 ▁▅▇▃▁
  AvgSessionLength          TimeonApp      TimeonWebsite LengthofMembership 
          1.370163           1.365696           1.367175           1.196052 
 YearlyAmountSpent 
        104.275551 
  AvgSessionLength          TimeonApp      TimeonWebsite LengthofMembership 
          6.607234           6.618842           6.091334           6.652788 
 YearlyAmountSpent 
        508.847880 
Estadísticas de forma
Variables Asimetria Curtosis
AvgSessionLength -0.0320782 2.999767
TimeonApp -0.0888535 3.111858
TimeonWebsite 0.0121054 2.890717
LengthofMembership -0.1062880 3.333553
YearlyAmountSpent 0.0346857 3.447373

Column

Interpretación estadísticas descriptivas

AvgSessionLength (Duración promedio de la sesión) La duración de las sesiones de los usuarios tiene una media y mediana de 33.1 minutos, con una desviación estándar de 0.99, lo que indica que las sesiones son relativamente homogéneas. El valor mínimo registrado es de 29.5 minutos y el máximo de 36.1 minutos, con un rango total de 6.61 minutos y un rango intercuartílico (IQR) de 1.37 minutos, lo que muestra baja dispersión en los datos. La asimetría de -0.0321 sugiere que la distribución es prácticamente simétrica, sin una inclinación significativa hacia valores altos o bajos. La curtosis de 3.00 indica que la forma de la distribución es muy similar a una normal, con una dispersión de datos dentro de los rangos esperados.

Time on App (Tiempo en la aplicación) El tiempo que los usuarios pasan en la aplicación tiene una media de 12.1 minutos y una mediana de 12.0 minutos, con una desviación estándar de 0.99, lo que indica que la variabilidad en el tiempo de uso es baja. El valor mínimo registrado es de 8.51 minutos y el máximo de 15.1 minutos, con un rango total de 6.62 minutos y un rango intercuartílico (IQR) de 1.37 minutos, mostrando que la mayoría de los usuarios tienen tiempos de uso muy similares. La asimetría de -0.0889 sugiere una ligera inclinación hacia valores más bajos, aunque no de manera significativa. La curtosis de 3.11 indica que la distribución es ligeramente más concentrada en la media en comparación con una distribución normal, lo que implica que los tiempos de uso están menos dispersos.

Time on Website (Tiempo en el sitio web) El tiempo de navegación en el sitio web tiene una media y mediana de 37.1 minutos, con una desviación estándar de 1.01, lo que sugiere que los usuarios pasan un tiempo relativamente estable en la plataforma. El tiempo mínimo registrado es de 33.9 minutos y el máximo de 40.0 minutos, con un rango total de 6.09 minutos y un rango intercuartílico (IQR) de 1.37 minutos, lo que indica que el 50% de los usuarios pasan entre 36.3 y 37.7 minutos en la web. La asimetría de 0.0121 muestra que la distribución es prácticamente simétrica, sin sesgos hacia valores altos o bajos. La curtosis de 2.89 indica que la distribución es ligeramente más plana que una normal, sugiriendo una menor concentración de valores en la media y una dispersión algo mayor.

Length of Membership (Duración de la membresía) El tiempo que los clientes han sido miembros de la plataforma tiene una media de 3.53 años y una mediana de 3.53 años, con una desviación estándar de 0.99, lo que indica que la mayoría de los clientes tienen tiempos de membresía similares. El valor mínimo registrado es de 0.27 años y el máximo de 6.92 años, con un rango total de 6.65 años y un rango intercuartílico (IQR) de 1.20 años, lo que significa que el 50% de los clientes tienen entre 2.93 y 4.13 años de membresía. La asimetría de -0.106 sugiere una leve inclinación hacia clientes con más años en la plataforma, mientras que la curtosis de 3.33 indica una ligera mayor concentración en la media, con pocos valores extremos.

Yearly Amount Spent (Cantidad anual gastada) El gasto anual de los clientes presenta una media de 499.3 dólares y una mediana de 499.0 dólares, con una desviación estándar de 79.3, lo que indica una mayor variabilidad en comparación con las otras variables. El gasto mínimo registrado es de 257.0 dólares y el máximo de 766.0 dólares, con un rango total de 508.8 dólares y un rango intercuartílico (IQR) de 104.3 dólares, mostrando que el 50% de los clientes gastan entre 445.0 y 549.0 dólares al año. La asimetría de 0.0347 indica que la distribución es casi perfectamente simétrica, mientras que la curtosis de 3.45 sugiere la presencia de algunos valores extremos, lo que podría representar clientes con patrones de gasto significativamente más altos que el promedio.

Inciso 4

Column

Gráficos univariados

Gráficos bivariados con “Yearly Amount Spent”

Column

Interpretación gráficos univariados

Interpretación gráficos bivariados

Inciso 5

Column

Gráfico de “AvgSessionGroup”

Descripción de “AvgSessionGroup”

Column

Interpretación estadísticas descriptivas y gráfico de “AvgSessionGroup”

Inciso 6

Column

Boxplot de la variable “Yearly Amount Spentr” por categoría

Column

Interpretación del Boxplot de la variable “Yearly Amount Spentr”

Inciso 7

Column

Matriz de las correlaciones

Gráficos bivariados con “Yearly Amount Spent”

Column

Columna Interpretación

Inciso 7B

Column

Matriz de las correlaciones

Heatmap de correlación

Inciso 7C

Column

Matriz de las correlaciones

Gráficos bivariados con “Yearly Amount Spent”

Column

Columna Interpretación

Inciso 8

Column

summary(modelo) - R2.train & R2.valid


Call:
lm(formula = YearlyAmountSpent ~ AvgSessionLength + TimeonApp + 
    TimeonWebsite + LengthofMembership, data = aux1, subset = train)

Residuals:
     Min       1Q   Median       3Q      Max 
-30.2617  -6.3368  -0.3456   6.8310  30.1189 

Coefficients:
                     Estimate Std. Error t value Pr(>|t|)    
(Intercept)        -1044.0993    24.9478 -41.851   <2e-16 ***
AvgSessionLength      25.5468     0.4951  51.595   <2e-16 ***
TimeonApp             38.9498     0.5073  76.775   <2e-16 ***
TimeonWebsite          0.3445     0.4871   0.707     0.48    
LengthofMembership    61.3558     0.5000 122.719   <2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 9.922 on 395 degrees of freedom
Multiple R-squared:  0.9839,    Adjusted R-squared:  0.9837 
F-statistic:  6034 on 4 and 395 DF,  p-value: < 2.2e-16
[1] 0.9838982
[1] 0.9851772

Column

Ajuste en ambas muestras